想象你在设计一个现代化都市的高速立交桥。每一个岔路口都是一次“分类”,而每一段连续行驶的匝道都是一次“分步”。如果统计显示特定背景的司机更倾向于选择某条路径,我们就进入了相关性分析的领域。这种从单纯的“数数”到寻找“规律”的跨越,正是本节课的核心逻辑:从离散的计数延伸到严密的代数证明与统计检验。
核心工具:赋值法与逻辑严密性
在处理二项式展开式时,赋值法是将恒等式转化为数值关系的“万能钥匙”。通过代入特殊值(如 $1, -1, 0$),我们可以瞬间剥离复杂的组合项,提取出系数的统计特性。
然而,计数的应用不仅在于代数。在实际建模中,一元线性回归模型和独立性检验是处理分类数据的利器。前者探讨变量间的趋势关联,后者利用 $2 \times 2$ 列联表判断两类现象是否具有统计学上的独立性。
一元线性回归模型:描述两个变量之间线性相关的数学方程,形式为 $y = bx + a + e$,其中 $e$ 是随机误差。
$$K^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}$$
1. 收集多项式各项:一个 x² 正方形,三个 x 矩形条,以及两个 1x1 单位正方形。
2. 开始将它们在几何上进行拼接。
3. 它们完美地形成了一个更大的连续长方形!宽度是 (x+2),高度是 (x+1)。
질문 1
用二项式定理证明 $55^{55} + 9$ 能被 $8$ 整除。
因为 $55 = 56 - 1$,展开后除最后两项外均被 $8$ 整除,最后两项和为 $8$。
因为 $55 = 56 - 1$,展开后所有项均被 $8$ 整除。
因为 $55^{55}$ 的末位数字是 $5$,加上 $9$ 后是 $4$,能被 $8$ 整除。
利用 $55 \equiv 7 \pmod{8}$,故 $7^{55} + 1 \equiv 0 \pmod{8}$。
正确。利用 $(56-1)^{55} = C_{55}^0 56^{55} - \cdots - C_{55}^{54} 56^1 + (-1)^{55}$。前 $55$ 项都含有因子 $56$(能被 $8$ 整除),最后一项是 $-1$。故原式 $= 8k - 1 + 9 = 8k + 8$,必能被 $8$ 整除。
错误。提示:将 $55$ 改写为 $56-1$,利用二项式展开观察余数项。
질문 2
在 $(1+x)^3+(1+x)^4+\dots+(1+x)^{12}$ 的展开式中, 含 $x^2$ 项的系数是多少?
$220$
$286$
$364$
$120$
正确。系数和为 $C_3^2 + C_4^2 + \cdots + C_{12}^2$。根据组合数性质 $C_n^k + C_n^{k+1} = C_{n+1}^{k+1}$,该式等于 $C_{13}^3 = \frac{13 \times 12 \times 11}{3 \times 2 \times 1} = 286$。
错误。提示:利用组合数性质 $C_n^k + C_n^{k+1} = C_{n+1}^{k+1}$ 逐步合并,或者视为等比数列求和后再展开。
질문 3
书架上层放有 $6$ 本不同的数学书,下层放有 $5$ 本不同的语文书。从书架上任取 $1$ 本书,有多少种不同的取法?
$11$
$30$
$1$
$65$
正确。根据分类加法计数原理,完成取一本书的任务可以分两类:取数学书($6$ 种)或取语文书($5$ 种)。总数 $= 6 + 5 = 11$。
错误。只需取一本书,这是一个并列的选择关系,应使用分类加法原理。
질문 4
书架上层放有 $6$ 本不同的数学书,下层放有 $5$ 本不同的语文书。从书架上数学书和语文书各取 $1$ 本,有多少种不同的取法?
$11$
$30$
$60$
$15$
正确。根据分步乘法计数原理,完成任务需分两步:第一步取数学书($6$ 种),第二步取语文书($5$ 种)。总数 $= 6 \times 5 = 30$。
错误。需要各取一本,意味着两步都必须完成,应使用分步乘法原理。
질문 5
在 $1, 2, \dots, 500$ 中,被 $5$ 除余 $2$ 的数共有多少个?
$99$
$100$
$101$
$50$
正确。这些数构成首项 $a_1=2$,公差 $d=5$ 的等差数列。设通项 $a_n = 2 + (n-1)5 \le 500$,解得 $n \le 100.6$。由于 $n$ 为整数,最大为 $100$。
错误。这些数构成等差数列 $2, 7, 12, \dots, 497$。计算其项数即可。
질문 6
已知 $(1+x)^n$ 展开式中所有二项式系数和为 $1024$,则 $n$ 为:
$8$
$9$
$10$
$11$
正确。利用赋值法 $x=1$,所有二项式系数和为 $2^n$。$2^{10} = 1024$,故 $n=10$。
错误。二项式系数之和恒等于 $2^n$。
질문 7
在二项式展开中,赋值 $x=-1$ 主要是为了证明什么?
所有系数之和为 $0$
奇数项二项式系数和等于偶数项二项式系数和
展开式中有负数项
中间项系数最大
正确。令 $x=-1$ 得到 $C_n^0 - C_n^1 + C_n^2 - C_n^3 + \cdots = 0$,整理得 $C_n^0 + C_n^2 + \cdots = C_n^1 + C_n^3 + \cdots$。
错误。代入 $-1$ 会导致正负相间,从而抵消。
질문 8
下列关于 $2 \times 2$ 列联表的说法正确的是:
用于研究两个分类变量的相关性
用于计算数值变量的平均值
只能用于样本量小于 30 的情况
其 $K^2$ 值越大,表示变量间相关性越弱
正确。$2 \times 2$ 列联表通过交叉计数,结合 $K^2$ 统计量来判断两个分类变量之间是否具有相关性。
错误。列联表是独立性检验的基础工具,用于分类变量的相关性分析。
질문 9
一元线性回归模型 $y = bx + a + e$ 中的 $e$ 代表什么?
自变量
因变量
随机误差(残差)
回归系数
正确。$e$ 是随机误差,表示模型无法通过线性部分解释的观测值波动。
错误。在统计模型中,$e$ (epsilon) 通常指代误差项。
挑战:从组合到统计的逻辑跨越
赋值法证明与独立性检验
情境 A (代数证明):已知 $(1-2x)^n = a_0 + a_1x + a_2x^2 + \cdots + a_nx^n$。若展开式中所有系数的绝对值之和为 $243$,求 $n$ 的值。
情境 B (统计应用):某研究机构对 100 名志愿者进行了一项关于“饮食习惯”与“身体健康指数”的调查,得到如下 $2 \times 2$ 列联表:
| 项 | 健康 | 亚健康 | 合计 |
|---|---|---|---|
| 健康饮食 | 40 | 10 | 50 |
| 非健康饮食 | 20 | 30 | 50 |
| 合计 | 60 | 40 | 100 |
질문 1
在情境 A 中,如何利用赋值法求出所有系数的“绝对值”之和?
详细解析:
1. 注意展开式为 $(1-2x)^n = a_0 + a_1x + a_2x^2 + \cdots$。由于奇数项 $x^k$ 会使系数带负号,绝对值之和意味着我们要让所有项变为正数。
2. 令 $x = -1$,则 $(1-2(-1))^n = a_0 + a_1(-1) + a_2(-1)^2 + \cdots = a_0 - a_1 + a_2 - \cdots$。这不完全是绝对值之和。
3. 实际上,系数 $a_k = C_n^k (-2)^k$。其绝对值和为 $|a_0| + |a_1| + \cdots = |C_n^0| + |C_n^1(-2)| + |C_n^2(-2)^2| + \cdots = C_n^0 2^0 + C_n^1 2^1 + C_n^2 2^2 + \cdots$。
4. 这等价于 $(1+2)^n$ 的展开式(即令 $x=1$ 并在计算前取绝对值,或直接令 $x=-1$ 处理符号)。
5. $3^n = 243 \implies 3^5 = 243$,故 $n=5$。
1. 注意展开式为 $(1-2x)^n = a_0 + a_1x + a_2x^2 + \cdots$。由于奇数项 $x^k$ 会使系数带负号,绝对值之和意味着我们要让所有项变为正数。
2. 令 $x = -1$,则 $(1-2(-1))^n = a_0 + a_1(-1) + a_2(-1)^2 + \cdots = a_0 - a_1 + a_2 - \cdots$。这不完全是绝对值之和。
3. 实际上,系数 $a_k = C_n^k (-2)^k$。其绝对值和为 $|a_0| + |a_1| + \cdots = |C_n^0| + |C_n^1(-2)| + |C_n^2(-2)^2| + \cdots = C_n^0 2^0 + C_n^1 2^1 + C_n^2 2^2 + \cdots$。
4. 这等价于 $(1+2)^n$ 的展开式(即令 $x=1$ 并在计算前取绝对值,或直接令 $x=-1$ 处理符号)。
5. $3^n = 243 \implies 3^5 = 243$,故 $n=5$。
질문 2
在情境 B 中,计算该实验的 $K^2$ 观测值,并判断在 $95\%$ 的把握下(阈值为 $3.841$)饮食习惯与健康是否相关?
详细解析:
1. 利用公式 $K^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}$。
2. 代入数据:$a=40, b=10, c=20, d=30, n=100$。
3. $K^2 = \frac{100(40 \times 30 - 10 \times 20)^2}{50 \times 50 \times 60 \times 40} = \frac{100(1200-200)^2}{6,000,000} = \frac{100(1,000,000)}{6,000,000} = \frac{100}{6} \approx 16.67$。
4. 判定:因为 $16.67 > 3.841$,所以 有 $95\%$ 以上的把握认为饮食习惯与健康相关。
1. 利用公式 $K^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}$。
2. 代入数据:$a=40, b=10, c=20, d=30, n=100$。
3. $K^2 = \frac{100(40 \times 30 - 10 \times 20)^2}{50 \times 50 \times 60 \times 40} = \frac{100(1200-200)^2}{6,000,000} = \frac{100(1,000,000)}{6,000,000} = \frac{100}{6} \approx 16.67$。
4. 判定:因为 $16.67 > 3.841$,所以 有 $95\%$ 以上的把握认为饮食习惯与健康相关。
✨ 核心要点
赋值 $1$ 与 $-1$,系数和尽显现。分类加法求完备,分步乘法保链条。排列有序,组合互异。独立检验看列联表,回归模型算相关!
💡 分类要做到“不重不漏”
分类后再分别对每一类进行计数,最后用分类加法计数原理求和,得到总数。切记不可有交叉重复的部分。
💡 分步要做到“步骤完整”
即完成了所有步骤,才能完成任务。分步后再计算每一步的方法数,最后根据分步乘法计数原理,把方法数相乘。
💡 排列与组合的区别
排列的特殊性在于元素的 '互异性' 和 '有序性'(如排队);组合的特殊性在于它只有元素的 '互异性' 而不需要考虑顺序(如选代表)。
💡 赋值法的妙用
面对复杂的二项式系数证明,首选 $x=1$ 求总和, $x=-1$ 求奇偶差。如果需要求部分项(如偶数项),则将两式相加除以 $2$。
💡 回归模型的残差理解
一元线性回归模型中的 $e$ 代表了无法被解释的随机变动。残差平方和越小,说明模型的拟合效果越好。